데이터로 듣는 50년 한반도의 이야기
과거의 과학은 망원경·현미경·플라스크였다. 21세기 과학에는 빅데이터라는 새 도구가 추가됐다. 인공위성·관측소·시민이 보내는 수십억 개의 측정값이 매일 쌓인다.
한국 기상청(KMA)은 1904년 첫 관측 이래 100년 이상의 기온·강수·풍속 데이터를 보유하고 있다. 특히 1973년부터는 전국 60여 개 관측소의 자료를 표준 절차로 수집해 누구나 무료로 다운로드할 수 있게 공개한다.
이 자료에서 우리는 어떤 이야기를 들을 수 있을까? 지구온난화는 정말 일어났을까? 폭염·열대야는 늘었을까? 강수 패턴은 변했을까? — 이번 실험은 관찰을 대신 정밀 측정 데이터를 분석하는 현대 과학의 모습이다.
탐구 문제와 가설
🎯 탐구 문제
지난 50년(1973~2023)간 한반도의 기후는 어떻게 변했을까? ① 연평균기온의 추세는? ② 폭염·열대야의 빈도는? ③ 강수 패턴은 어떻게 변했나?
준비물 — 데이터와 도구
컴퓨터·태블릿
인터넷 접속 가능
KMA 기상자료
data.kma.go.kr
스프레드시트
엑셀·구글시트
그래프 도구
차트 기능 활용
(심화) Python
pandas·matplotlib
탐구 노트
가설·분석·결론
💡 안전: 화면 시간이 길어질 수 있다. 50분마다 10분 휴식. 데이터 처리 중 백업 자주 하기.
실험 설계 — 데이터 수집 방법
📥 어디서 어떻게 데이터를 얻는가
기상청 기상자료개방포털(data.kma.go.kr)에서 누구나 데이터를 받을 수 있다. 회원가입 후 다음을 다운로드한다:
- 📥 지상관측 → 종관 ASOS → 연도별 기온: 서울·부산·대구 등 6개 도시 1973~2023 연평균기온
- 📥 이상기후 → 폭염일수: 일 최고기온 33°C 이상 일수
- 📥 이상기후 → 열대야일수: 야간 최저기온 25°C 이상 일수
- 📥 (옵션) 강수량: 연 강수·여름 집중호우 빈도
활동 과정
- 기상자료개방포털에 접속해 서울 관측소의 1973~2023 연평균기온 데이터를 다운로드한다 (CSV 파일).
- 스프레드시트로 열어 '연도'와 '평균기온' 두 열만 정리한다. 빈 칸·이상치를 확인하고 처리한다.
- X축=연도, Y축=기온으로 꺾은선 그래프를 그린다. 시각적으로 추세를 파악한다.
- 스프레드시트 '추세선 추가' 기능으로 선형 회귀선을 그어 본다. 기울기 = 10년당 기온 상승률.
- 5년 또는 10년 이동평균을 계산해 단기 변동을 제거한 장기 추세를 본다.
- 같은 작업을 폭염일수, 열대야일수에도 반복한다.
- 여러 도시(서울·부산·대구·강릉) 데이터를 비교해 지역 차를 살펴본다.
- 분석한 그래프와 통계를 사용해 결론 보고서를 작성하고 모둠 발표한다.
실제 데이터 — 서울 1973~2023
📊 서울 연평균기온 변화 (5년 평균, KMA 데이터 기반)
| 기간 | 연평균기온 (°C) | 폭염일수 (일/년) | 열대야일수 (일/년) | 변화 |
|---|---|---|---|---|
| 1973~1977 | 11.8 | 3.2 | 2.4 | 기준 |
| 1983~1987 | 12.0 | 4.1 | 3.8 | ↑ 0.2°C |
| 1993~1997 | 12.5 | 5.6 | 5.2 | ↑ 0.7°C |
| 2003~2007 | 12.9 | 7.4 | 8.6 | ↑ 1.1°C |
| 2013~2017 | 13.2 | 12.8 | 14.2 | ↑ 1.4°C |
| 2019~2023 | 13.5 | 15.3 | 17.6 | ↑ 1.7°C |
⚠️ 위 데이터는 학습을 위한 정리값입니다. 실제 KMA 자료는 더 미세한 변동을 보입니다. 원본 데이터는 data.kma.go.kr에서 무료로 확인하세요.
인터랙티브 차트 — 직접 분석해 보기
📈 한반도 50년 기후 빅데이터
🗓️ 월별 기온 히트맵 (서울 1973~2023)
월별 평균기온 (°C) — 가로: 1~12월, 세로: 연도
자료 표상의 다양한 방법
같은 데이터라도 표상 방식에 따라 보이는 패턴이 달라진다. 한 가지에 의존하지 말고 여러 방법을 함께 사용하는 것이 데이터 과학자의 첫 원칙이다.
꺾은선 그래프
시간에 따른 변화 추세 파악에 최적.
막대 그래프
연도·도시 등 범주 간 비교.
히트맵
두 축의 패턴(연·월)을 색으로 시각화.
박스플롯
분포·중앙값·이상치 확인.
지도 시각화
지역별 차이를 공간적으로 표현.
회귀선
추세 정량화 — 10년당 변화율.
결론과 토의
📍 결론
① 서울 연평균기온은 50년간 약 1.7°C 상승했다. 10년당 약 0.34°C — IPCC 글로벌 평균(0.18°C/10년)의 거의 2배 속도.
② 폭염일수는 1970년대 평균 3일에서 최근 15일로 약 5배 증가했다.
③ 열대야일수는 약 7배 증가했다. 도시화·도시 열섬 효과 + 지구온난화의 결합.
④ 가설이 증거에 의해 강력히 지지되었다.
📢 결과를 어떻게 소통할 것인가
좋은 데이터 분석은 전달이 절반이다. 같은 결과를 어떻게 표현하느냐에 따라 메시지가 달라진다:
- 과학 보고서: 평균·표준편차·통계 검정과 함께 정량적으로.
- 인포그래픽: 핵심 숫자 1~2개를 시각적 임팩트로.
- SNS·뉴스: "내가 태어난 해보다 +1.5°C 더 더운 여름" — 감정적 공감.
- 정책 보고: 미래 예측 + 대응 방안 + 비용 분석.
같은 데이터로 다양한 청중에게 정확히 전달하는 것이 과학적 의사소통(SciComm)의 핵심이다.
토의 — 빅데이터 시대의 과학
📌 이 탐구가 보여주는 새로운 과학
① 실험실 밖의 자료. 갈릴레오의 경사면, 파스퇴르의 플라스크 — 모두 직접 실험으로 자료를 만들었다. 이제는 정부·NASA·민간이 매일 측정하는 방대한 공개 자료를 활용하는 시대다.
② 시민 과학자. 전문 장비 없어도 누구나 KMA·NASA·GBIF 등에서 자료를 받아 분석할 수 있다. 학생도 진짜 과학자가 될 수 있다.
③ 협동의 가치. 50년 자료는 한 사람이 모을 수 없다. 수많은 관측원·연구자·기관의 협력이 있었기에 가능했다. 과학은 본질적으로 협업이다.
④ 분석 도구의 발전. 50년 전엔 종이에 그래프를 그렸지만, 이제는 Python·R·AI로 수십 년 자료를 몇 초에 분석한다. 디지털 소양이 곧 과학 소양.
당신이 관심 있는 사회/자연 문제에 대해 빅데이터로 답할 수 있는 질문을 만들어 보세요. 예: 한국 강수량의 계절별 변화 / 미세먼지와 기후의 관계 / 우리 학교 주변의 도시 열섬. 어디서 어떤 자료를 어떻게 분석할 것인가?